
3D版DeepSeek卷起开源月:两大基础模型率先SOTA!又是VAST
3D版DeepSeek卷起开源月:两大基础模型率先SOTA!又是VAST3D生成版DeepSeek再上新高度!
3D生成版DeepSeek再上新高度!
从单张图像生成灵活视角3D场景的技术来了,在考古保护、自主导航等直接获取3D数据成本高昂或不可行的领域具有重要应用价值。
在互联网时代,数据已成为企业发展的必经之路。
三维高斯泼溅(3D Gaussian Splatting, 3DGS)技术基于高斯分布的概率模型叠加来表征场景,但其重建结果在几何和纹理边界处往往存在模糊问题。
「仅需一次前向推理,即可预测相机参数、深度图、点云与 3D 轨迹 ——VGGT 如何重新定义 3D 视觉?」
CAMEL-AI 团队在 Manus 上线后 1 天内推出的 OWL 就是其中最具代表性的一个,项目实测成绩达到开源界 GAIA 性能天花板,达到了 58.18%,超越 Huggingface 提出的 Open Deep Research 55.15% 的表现。
3 月 28 日,专注于构建通用 3D 大模型的 VAST 一口气开源了两个 3D 生成项目 ——TripoSG 和 TripoSF。前者是一款基础 3D 生成模型,在图像到 3D 生成任务上远超所有闭源模型;后者则是 VAST 新一代三维基础模型 TripoSF 能在所有闭源模型中同样取得 SOTA 的基础组件,用于高分辨率的三维重建和生成任务。
图像编辑大礼包!美图5篇技术论文入围CVPR 2025。
PPT对大部分朋友的的价值不言而喻。我在日常做商业咨询时也需要大量PPT做交付,所以从年初开始,我尝试让AI来完成商业PPT的生成和设计。目前效果大致如下:视觉效果是有点超出我的预期的。而且从可读性、图形化、信息整理几个角度来说,这些结果已经完全够用了。同时这些生成的PPT可以是动态的:
还记得之前推荐过一键生成网页代码的 readdy.ai(好用到哭!AI神器Readdy,一键生成网页代码,前端工程师要失业了?),如今这样的神器市场上已冒出一大堆。我们做个详细点的对比,然后根据不同的用户场景,做出一些推荐。